草庐IT

Hadoop : NoSuchMethodException

全部标签

Hadoop单节点启动问题

我正在尝试通过执行来启动hadoop独立服务器(在aws中)start-dfs.sh文件但出现以下错误Startingnamenodeson[ip-xxx-xx-xxx-xx]ip-xxx-xx-xxx-xx:Permissiondenied(publickey).Startingdatanodeslocalhost:Permissiondenied(publickey).Exceptioninthread"main"java.lang.UnsupportedClassVersionError:org/apache/hadoop/hdfs/tools/GetConf:Unsupport

java - Hadoop MapReduce 环境变量

我正在试验HadoopMapReuce环境变量。我的用例很不寻常,但这不是我挣扎的原因。我的目标是在我的所有映射器和缩减器上导出环境变量。为此,我通过以下方式使用mapreduce.map.env和mapreduce.reduce.envconf设置:hadoopjarmyJob.jar-Dmapreduce.map.env="A=foo"这很好用,确实在我所有的映射器上公开了A。在那一点上,我会提到mapreduce.map.env确实缺乏互联网上的文档或用例示例。我的问题是我的项目按层运行MapReduce作业,每个层都可以将标志传递给hadoopjar命令,而我不控制上层。因此我

Hadoop 调度程序与 oozie

oozie和Hadoop调度程序(FIFO、Fair、Capacity、Delay等)之间有什么区别?哪一个通常用于生产环境? 最佳答案 它们提供不同的功能。Oozie是一个作业调度程序和编排引擎。它将在配置的队列中执行YARN作业。例如,mapreduce.job.queuename在MR/Java操作中,tez.queue.name在HiveAction中(在Tez上),或--queue在星火。您使用的队列取决于您拥有的工作负载,但Fair或Capacity最适合Multi-Tenancy工作负载。如果您有需要在其他作业之前运行

hadoop - YARN 无法找到或加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster

我的查询:我在ubantu上安装了配置单元。我之前测试过它是工作文件,但后来它开始出错。insertintotest2values(1,'Mahendra');我的hive错误:QueryID=mahendra_20180827145546_86973630-5eff-4764-ade8-cfc3a8ce5c37Totaljobs=3LaunchingJob1outof3Numberofreducetasksdeterminedatcompiletime:1Inordertochangetheaverageloadforareducer(inbytes):sethive.exec.re

hadoop - 对相同的 reduce 任务的两次尝试是否应该继续并行运行?

我的hadoopreduce任务中的Action有外部效果,而且它们不是幂等的。我在任务跟踪器中观察到,尝试了一个reducer,然后启动了同一组键的另一个reducer,而没有杀死原来的reducer。我配置错了吗?这是这个reduce任务的表: 最佳答案 这是由于hadoop中的推测执行。如果Hadoop检测到少数集群节点上有一些慢速任务,它是Hadoop指定备份任务的选项。备份任务将优先安排在速度较快的节点上。重复任务中最先完成的任务将成为用于进一步操作的任务。您可以通过将以下参数设置为false来关闭此功能mapred.re

hadoop - 使用 hadoop-functions.sh 启动 hadoop 失败

我尝试启动hadoop,但它失败了,没有任何启动。按照控制台日志。Mac:sbinlqs2$shstart-all.sh/Users/lqs2/Library/hadoop-3.1.1/libexec/hadoop-functions.sh:line398:syntaxerrornearunexpectedtoken`我已经尝试过任何方法来解决它,但没有任何反应。即使我重新安装了最新版本。但是错误是一样的。这几乎让我发疯。任何答案都是有帮助的。谢谢。 最佳答案 Hadoop脚本需要bash,而不是sh$chmod+xstart-al

hadoop - 同时使用 max 和 sum

我有一种情况,我必须求和并最大数量来处理多个每天条目。我在clouderahive中有一个输入表:----------------------------date1|date2|qty----------------------------20180101|20180101|50----------------------------20180101|20180101|15----------------------------20180101|20180102|1----------------------------20180101|20180103|3--------------

hadoop - Hive:如何处理数据文件中有分隔符的文件?

我有以下数据需要插入到配置单元表中。数据在文件中具有默认分隔符。如何插入到Hive表中?10,Andrew,Man”,”ager,DE,PC11,Arun,Manager,NJ,PC12,Harish,Sales,NJ,MAC13,Robert,Manager,PA,MAC14,Laura,Engineer,PA,MAC谢谢! 最佳答案 尝试使用CSVSerdecreatetabletest_table(idint,...)ROWFORMATSERDE'org.apache.hadoop.hive.serde2.OpenCSVSer

hadoop - hortonworks 沙箱 : connection denied

如何通过ssh连接到hortonworks的沙箱(2.5)?sshmaria_dev@127.0.0.1我收到消息:权限被拒绝,请重试 最佳答案 我整理好了。有必要把端口放在最后。sshmaria_dev@127.0.0.1-p2222 关于hadoop-hortonworks沙箱:connectiondenied,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/52163040/

hadoop - Hive - 将 'yyyy-MM-dd' 之类的字符串转换为数据类型为“yyyy-MM-dd”的日期

我在hive中有一个外部表,它的列为report_dt,数据类型为string,其值类似于2018-09-022018-09-03而且我想根据写在这个外部表上的查询创建托管表,其中report_dt_1作为列,数据类型为date我已经经历了一些线程,我能够像这样查询createtablemanag_newtableasselectto_date(from_unixtime(unix_timestamp(report_dt,'yyyy-MM-dd'),'yyyy-MM-dd'))asreport_dt_1fromexter_table;所以上面的查询创建了一个新表,但是当我descman